iT邦幫忙

2024 iThome 鐵人賽

DAY 4
0
AI/ ML & Data

我的深度學習-從0開始實作物件偵測系列 第 4

【Day 4】YOLO的版本迭代介紹之 2

  • 分享至 

  • xImage
  •  

一、前言

由上篇可以了解v1到v3的版本差異,在之後的版本追求的都是更輕量化、速度更快且更好的辨識能力,本篇將延續上篇繼續介紹v5到v9的版本差異。

YOLO v4

此次更新相較於以往差異較大,v4將Object Detector拆成不同的部分,並做了一系列的修改。

  • Backbone: 加入了CSP,把上層的Channel分成兩份,並複製一份倒下層使用,是一種DanseNet的改進方式。
  • Data/Label: 新增了馬賽克拼貼、CutMix的數據增廣方式,並使用Smooth Label作為訓練輸入。
    image

馬賽克拼貼數據增廣。圖片來源:YOLO v4 Paper

YOLO v5

YOLO v5採用了現在最流行的pyTorch來實作。v5的優勢在於比v4更輕量化,且準確率與v4相似。

  • 將v4版本骨幹網路中的CSP(Channel and Spatial Pyramid)結構拓展到了NECK結構中。
  • 使用SPPF結構取代了SPP。
    image

v5與v4測試對比。圖片來源:YOLOv5 PyTorch Object Detection Model (roboflow.com)

YOLO v6

算法思路類似YOLOv5(backbone+neck)+YOLOX(head)。

  • Neck是基於Rep和PAN建構了Rep-PAN
  • 偵測頭部分模仿YOLOX,進行了解耦操作,並進行了少許優化。
    image

v6、v7與v8的測試對比。來源:YOLO v6 Paper

接著就是最後的V7到V9的部分,那我們明天見。

image


上一篇
【Day 3】YOLO的版本迭代介紹之 1
下一篇
【Day 5】YOLO的版本迭代介紹之 3
系列文
我的深度學習-從0開始實作物件偵測30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言